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«Семантическое безумие» 
в ИТ-системах 


Это всё однои то же? 
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«Семантическое безумие» на проектах и в спецификациях 


Модель данных как производная онтологии предметной области 


Расхождения в моделях данных неизбежны, как с ними быть? 


«Субьект», «Объект», «Атрибут», DDD и Open АРІ 


Новые роли для поддержки архитектуры моделей данных 


На помощь спешит математика. Методы кластеризации 


Зачем нужны метрики моделей данных? 
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«Семантическое безумие» 


в ИТ-системах 


Часто при аналитике ИТ-систем мы говорим разными словами об одном и том же, и 


одинаковыми словами — о разном 
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Сущность 


Проблема - Решение - Цель 


Проблема «Семантическое безумие» АЎ 


Определить субъекты и объекты предметного поля и сопоставить 2; 


Решение им классы и таблицы баз данных в информационной системе 


Получить обьекты с набором атрибутов, которые бы однозначно (С) 
характеризовали его в любом необходимом бизнес-процессе 


«Видов столько, сколько различных форм 
в начале мира создал Всемогуший» 


-- Карл Линей (1707 - 1778) 


Бизнес-субъекты и бизнес-объекты 


Деловой оборот банка 


|Т-система 


ведут д еловой оборот: Передача Обработка 


Атрибут (Ргорему) — 


это свойство объекта, 
имеющее значение в 
деловом обороте 


Хранение 


Схемы XSD и./5ОМб6сйета 


лассы языков программирования 
итабл: баз данных 


«Семантическое безумие» — 
состояние артефактов не позволяющее 


однозначно определеить сематический 
смысл передаваемых данных 


Дублирование данных в 
сообщениях и таблицах 


Затруднения при 
определении границ, 
микросервисов 


Невозможность привести 
таблицы баз данных данных к 
нормальным формам 


Отсутствие единства и 
согласованности 
терминологии в 

документации 


Интеграция с внешней системой 


Что нужно 
сделать 


В чём 
сложность 


Интеграция с внешней системой 


Необходимо сделать маппинги, по которым в 
адаптере будут осуществляться преобразование 
данных из одной модели в другую 


Однозначно сопоставить одну сущность другой 
не всегда представляется возможным 


Команды пользуются различной терминологией и 
различным сленгом, который используют для 
описания процессов 
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Модель данных 


| 
| 


ІТ-сервис 


Модель данных 
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Семантическое безумие в Confluence >»: 


Что нужно 
сделать 


В чём 
сложность 


Семантическое безумие в Confluence 


Необходимо описать процесс, происходящий на 
платформе понятным всем работающим командам 
языком 


Если Wiki страница редактируется членами различных 
команд, имеющих различный сленг и использующих 
различную терминологию, есть риск потерять 
исходный смысл описываемой сущности 


Команды пользуются различной терминологией и 
различным сленгом при описании процессов 


Сатипаа «Вилами» 


Я называю этот процесс в 
Сотипдаа «Триггером» 


А я говорю, что это «шлюз» 


Да это же старый добрый ЇН-е!5е 


Больше похоже на switch 


Поглошцение одного бизнеса другим 


Что нужно 


сделать 


В чём 
сложность 


Поглощение одного бизнеса другим 


Необходимо интегрировать одну ІТ-систему в другую 


Однозначно сопоставить одну сущность другой не 
всегда представляется возможным 


Команды пользуются различной терминологией и 
различным сленгом при описании процессов 


Различные языки 


Разные объекты 


Фреймворки 


Разные атрибуты 


Разные словари 


СУБД 
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Модель данных Модель данных 
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ЇТ-сервис 
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ЇТ-сервис 


Новая команда заходит на Платформу 


Новая команда заходит на Платформу 


Что нужно Необходимо интегрировать новую команду 
сделать в П-систему 


В чём Однозначно сопоставить одну сущность другой не 
сложность всегда представляется возможным 


Команды пользуются различной терминологией и 
различным сленгом при описании процессов 


Модель данных 


Справочники, 
словари 


Нотации 


Фреймворки и 
СУБД 


Developer 


Стратегия 


тестирования 


Глобальные бизнес-объекты 
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Определение объектов и субъектов 
предметного поля 


Декларативный способ Построение онтологии Кластеризация 


Что это? Что это? Что это? 

Аналитики заранее договариваются о Построение онтологии при помощи Применение экспрессных, как правило 
субъектах, объектах и их атрибутах, онтологического моделера математических методик для 
действуя совместно определения глобальных бизнес- 


сущностей, учавствующих в 
информационном обмене 


> 2 
Когда? Когда? Когда? 
До начала работ Работы уже начаты Работы уже начаты 
Метод Метод Метод 
Декларативное описание предметного Построение онтологической модели та 
поля на уровне верхнеуровневой предметного поля при помощи языка р Е алиа нення га 
архитектуре OWL р р 


семантического описания обьектов и их 
атрибутного состава 


Определение объектов и субъектов 


предметного поля 


Бизнес- Модель Инфо 


данные данных система 


Субъекты и Сообщения в 
объекты бизнес- информационной 
процесса системе 


Классы языков 
Предметное программирования, 
поле микросервисы и 
таблицы БД 


Х5р 
Ј5оМ5сћета 
.ЛАУАсіав5 
501 Таре 


Global 


Business 
Objects 
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Модель 
данных 


Domain 
Driven 
Design 


Маппинг 


данных 


Ореп АР! 
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Модель 
данных 
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Формально верхнеуровневая 
спецификация 


Необходимо интегрироваться с уже работающей системой и суть передаваемых данных известна. 
Структура данных в этом случае может быть скопирована и схемы применены аналогичные. 


Документация 


Онтология 
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Онтология 


Семантическая разметка 


Определение семантического ядра 


Определение глобальных сущностей на 
его основе 


Кластеризация 


Определение субъектов, объектов и 
связей между ними 


Построение концептуальной схемы 
взаимодействия 
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Построение онтологической модели 
при помощи онтологических 
моделеров и языка ОМЛ. 
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Методы кластеризации для | 
приведения моделей данных > 
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Конвейер кластеризации 


Х5р Ј5ОМ5сћета Х50 ./5ОМ5сһета 


17; Векторы Сходство 


Новая модель 


признаков 


~ 

ж. 

> 
Бекторы » > » Векторы 
признаков признаков 


Метрики пространственного сходства 


Сходство строк 


Дистанция редактирования 
• Левенштейна 

• Смита-Ватермана 

. Аффинное 


Выравнивание 
» Джаро-Винклера 
• Soft ТЕ-ШЕ 


• Монг-Злкан 


Фонетика 
. Созвучие 
• Перевод 


ы х 


Метрическое расстояние 


. Евклидово 
. Манхетенское 


. Минковского 


Аналитика текста 
. Жаккарда 
• TF-IDF 


о Косинусово сходство 


Сходство отношений 


На основе множеств 

, Кубика 

- Жаккара 

• | До общих соседей 

- Взвешенное расстояние Адара 


Группировка 
• Средние значения 


• Максимальные\ минимальные 
значения 


. Медиана 
• Частота (мода) 
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Алгоритм Левенштейна/ | 
Поиск редакционных расстояний 


“е > 


«Номер счета 
физического лица» 


«Номер счета Редакционное 
физика» расстояние 


«Номер счета 
юридического лица» 


«Номер счета физического лица» 
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Учет угла между векторами. Проекцил 
одного вектора на другой 


Евклидово расстолние Ра Расстояние Махаланобиса 
1 


1 
Манхетенское расстояние Расстояние Жаккарда | 


Расстолние Минковского Расстояние редактирования 


Учет угла между векторами. Проекцил 
одного вектора на другой 


аъ 


Наименование [органа 


Туманность сведений о заёмщике 


Галактика информации о продуктах 


Как определить величину 
семантической орбиты? 


Номер отделения, в котором 
открыт счёт клиента -6,62 


Номер счёта 
> 


Номер телефона 
клиента -7,00 


--- 


Положение объекта 
Возьмем за нуль 


адаг и не 


Визуализируем предметное поле 
через расстояние Минковского 


Номер счёта физического лица 


АПВ 


Визуализируем предметное поле 
через расстояние Минковского 


Номер счёта физического лица 


Практическое использование общей схемы 
бизнес-объектов при работе с гибкими 


методологиями и микросервисами 


Используем в сообщениях глобальные бизнес-объекты 


1 Атрибут 


1 


Глобальный 2 Атрибут 


бизнес-объект 
3 Атрибут 


2 


Глобальный 
бизнес-объект 


2 Атрибут 


3 


Глобальный 
бизнес-объект 


Структурированное для 
передачи данных набирается из 
глобальных бизнес-объектов 


Во избежание ошибок всем 
атрибутам выставляется 
обязательность FALSE 
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Аналитик 


\ 
Аналитик 


Аналитик 
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Локальный 
репозиторий 
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Локальный 
репозиторий 
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Локальный 


репозиторий 


Сервер СП 


Меняем модель данных путем добавления к 
глобальным бизнес-сущностям новых атрибутов 


1 Атрибут 


По мере надобности новые 
2 Атрибут атрибуты добавляются в конец 
старых 


1 


Глобальный 
бизнес-объект 4 Атрибут 


З Атрибут 


Старые атрибуты не удаляются 
никогда 
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Глобальный 


3 Атрибут 
бизнес-объект 


4 Атрибут 
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Глобальный 


бизнес-объект 
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дальше? р =) 
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Что же дальше? 


Стандартизация и 


классификация 
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Границы микросервисов 


Семантическое безумие порождает 
размытые границы микросервисов 


Что нужно Определить объекты и субъекты 
сделать бизнес-процессов 


Из-за различной терминологии и 
семантики атомизировать процессы не 
всегда представляется возможным 


В чём 
сложность 


Команды пользуются различной 
терминологией и различным сленгом 
при описании процессов 


Что же дальше? Краткие выводы. 
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Для передачи данных и 


построение табл 
используем глобальные 
бизнес-сущности 
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